V2EX  ›  英汉词典
Enqueued related words: Prioritized Experience Replay

Experience Replay

释义 Definition

经验回放:强化学习中常用的一种训练方法,把智能体过去的交互经历(状态、动作、奖励、下一状态等)存入“回放缓冲区”,训练时再随机抽取小批量样本进行学习。这样可以打破数据相关性提高样本利用率、让训练更稳定。(在一些语境下也指其变体,如“优先经验回放”。)

发音 Pronunciation

/ɪkˈspɪəriəns rɪˈpleɪ/

例句 Examples

Experience replay helps the agent learn from past mistakes.
经验回放帮助智能体从过去的错误中学习。

By sampling transitions uniformly from a replay buffer, the algorithm reduces correlation between updates and improves training stability.
通过从回放缓冲区均匀采样转移样本,该算法降低了更新之间的相关性,并提升了训练稳定性。

词源 Etymology

该短语由 experience(经验、经历) + replay(重放、回放)构成,字面意思是“把经历再放一遍”。在强化学习里,它被借用来表示:把过去的交互数据“重播”给学习算法,用于反复训练与巩固。

相关词 Related Words

文学与著名作品 Literary & Notable Works

  • Lin, Long-Ji (1992) Self-Improving Reactive Agents Based on Reinforcement Learning, Planning and Teaching(较早系统提出将“回放/再利用经验”用于强化学习训练的思想)
  • Mnih et al. (2015) Human-level control through deep reinforcement learning(Nature;DQN 论文,使 experience replay 广为人知)
  • Schaul et al. (2015) Prioritized Experience Replay(提出“优先经验回放”,按重要性采样提升学习效率)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   750 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 22:48 · PVG 06:48 · LAX 14:48 · JFK 17:48
♥ Do have faith in what you're doing.